管理统计学要点

管理统计学要点
2022 年 6 月 28 日
2:26

计量时的测量尺度排序:定类 定序 定距 定比
static 经验公式求 k 值,分多少个组。k=1+lgn/lg2
频数分布的组限一般是<=,但是有特例,4000-5000 5000 以上两个组,一般 5000 包含到最后一个组
区分离散型和连续型随机变量
平均数、中位数和众数的关系引发的图左右偏,右偏就是尾巴在右面,此时平均数大于中位数,左偏中位数大于平均数
箱线图要会看、茎叶图会看
散点图适合什么(揭示不同变量的关系)、直方图适合什么(将频数分布表的信息以图形形势表现)、条形图适合什么(反映了数据的分布规律)、面积图适合什么、折线图适合什么、雷达图(展现超过两个变量或指标的数据)
变异系数、离散系数 sigma/x 拔*100%,不同量纲比较离散性
偏态系数的区间 软件(-1,1),平时(-3,3)
参数估计:点估计(评价准则:无偏性、有效性、一致性)、区间估计
当样本量大于 30,中心极限定理适用;当样本量大于 15,如果分布对称,中心极限定理适用;总体本身是正态分布,无论样本大小,都适合中心极限定理
影响置信区间宽度的因素:置信水平、标准差、样本容量 (均值不影响)
与原假设相反的是备择假设,0 假设是原假设
z-score 标准化方法,给一组数,进行 z 转换,(x-miu)/sigma
什么是显著性水平,a 是什么(h0 为真,拒绝 h0 的概率)
什么是参数检验和非参数检验?如果不能用参数检验(z 检验、t 检验、方差分析检验),那么用非参数检验(卡方检验、流程检验),总体不是正态分布,用非参数检验
什么是相关关系?类型有哪一些?如何判定相关性?相关系数 r,回归属于相关关系
影响时间序列的因素有哪些?趋势、波动。规则性的波动不会产生影响
多元线性回归模型的指标?一元是 R 平方,多元是 R 修平方
估计量评价的标准有三种:无偏性(数学期望等于总体参数均值)、一致性(样本无穷大时,估计值应该准确)、有效性(离散程度较小的估计量更有效)分别有什么用
事件独立时概率等于什么
一类错误:拒真 二类错误:取伪,根据实际情况判断一类错误二类错误
显著性水平越大,检验结果越不显著,显著水平越小,检验结果越显著
方差、标准差公式